Semistrukturierte Daten

Als Semistrukturierte Daten bezeichnet man in der Datenbankforschung (Informatik) Informationen, die keiner allgemeinen Struktur unterliegen, sondern einen Teil der Strukturinformation mit sich tragen.

Während bei der strukturierten Datenhaltung ein Datenbankmodell zugrunde liegen muss, das das Aussehen der Datenelemente (Objekte) enthält, fehlt ein solches bei semistrukturierten Daten.

Semistrukturierte Daten müssen keinem Typenmodell unterworfen werden; somit kann sich eine Datensammlung aus semistrukturierten Daten beliebig erweitern. Ein Strukturmodell kann nachfolgend impliziert werden.

Semistrukturierte Daten können mit Hilfe von Grammatik und Lexik in eine Form gebracht werden, die folgende Charakteristika aufweist:

(E1) Die Datensammlung besteht aus einer oder mehreren Folgen von Objekten.
(E2) Objekte können entweder in Attribute zerlegt werden (komplexe Objekte) oder sie sind atomare Objekte.
(E3) Atomare Objekte enthalten Werte eines bekannten, elementaren Datentyps.

Semistrukturierte Daten mit den Eigenschaften (E1), (E2) und (E3) werden als wohlgeformte semistrukturierte Daten bezeichnet.

Das Object Exchange Model (OE-Modell) hat sich de facto als Modell für semistrukturierte Daten durchgesetzt. Daten, die diese Eigenschaften aufweisen, können auch als wohlgeformte XML-Dokumente beschrieben werden.


© MMXXIII Rich X Search. We shall prevail. All rights reserved. Rich X Search